DSpeech (por Dimio)
~~~~~~~~~~~~~~~~~~

A verso atualizada pode ser encontrada no seguinte link:

Home: "http://dimio.altervista.org/"

DESCRIO:
~~~~~~~~~~~~

O DSpeech  um programa de TTS (Text To Speech) com funcionalidade de ASR (Automatic Speech Recognition) integrada. E 'que est preparado para ler em voz alta o texto escrito e escolher as frases para Pronunciar de acordo com as respostas vocais do consumidor.  'projetado especificamente para dar respostas de forma rpida
Possi as funes de maior utilidade prtica que so necessrias para os programas deste tipo, Mantendo, entretanto, a limpeza do registo do computador e o consumo de recursos (no  Instalado, mas pode ser colocado no menu de contexto, mantendo uma leveza constante).

As principais caractersticas do DSpeech so:

1. Permite salvar a sada na forma de um arquivo Wav ou Mp3.
2. Permite selecionar rapidamente vozes diferentes e combin-las para criar dilogos entre as mesmas.
3. Contm um sistema de reconhecimento vocal que, atravs de uma linguagem simples de script, permite criar Dilogos interativos com o consumidor (vlido apenas para alguns idiomas).
4. Permite configurar as vozes de forma independente.
5. Atravs de etiquetas especiais, permite variar dinamicamente as caractersticas das vozes durante a reproduo (Velocidade, volume e frequncia), para inserir quebras, enfatizar termos ou fazer a ortografia.
6. Permite capturar e reproduzir automaticamente o contedo da rea de transferncia.
7. Suporta todos os mecanismos vocais compatveis com SAPI 4 e 5, possuindo, tambm, uma srie de caractersticas secundrias, entre as quais se destacam:

1. No arranque do programa, permite carregar automaticamente o ltimo ficheiro aberto, indo directamente para a posio relativa de leitura onde o usurio tinha ficado.
2. Suporta a linha de comando, permitindo ao usurioa construo de livros em udio, sem recurso  interface grfica ou para outros fins.
3. Permite especificar o formato da sada de udio, o que pode ser til em situaes muito particulares, quando Existe a necessidade de operar com alguns arquivos wav de caractersticas definidas.
4. Permite criar algumas montagens inserindo, atravs de palavras-chave especiais, alguns elementos nos arquivos wav ou mp3. Isso pode ser til para apresentar, durante a leitura, os efeitos particulares como um golpe de tosse, riso ou Tambm do seu filme musical.
5. Quando os mp3s so guardados,  possvel especificar a qualidade dos mesmos, de forma a privilegiar as Dimenses ou a qualidade do resultado.
6. Agora,  possvel converter integralmente um texto em mp3 ou dividi-lo em ficheiros de 5, 10 ou 15 minutos cada.
7. No ficheiro "CustomTAG.TXT",  possvel inserir etiquetas personalizadas que aparecero no Menu contextual (por exemplo, as tags expressivas de Loquendo).



TEXTO PARA VOZ:
~~~~~~~~~~~~~~~

Atravs do menu contextual (clique direito)  possvel especificar com qual das vozes deve ser lido uma frase, o que facilita a criao de dilogos entre diferentes vozes.
Tambm  possvel inserir etiquetas especiais que permitem modificar as caractersticas da voz, ao longo da leitura (velocidade, volume, freqncia etc).



OPES DE UDIO:
~~~~~~~~~~~~~~

 'possvel especificar a placa de  udio, para redirecionar a sada e, acima de tudo, a taxa de bits das vozes Que esto a ser usadas.  conveniente tentar sempre usar a mesma taxa de bits das vozes em uso, caso contrrio, poder haver perdas De qualidade (como se a voz falasse com uma lata).
Em geral, a performance usada pela maior parte das vozes sintticas : "16 Khz 16 Mono Bit",
Enquanto as vozes da Microsoft usam "22 Khz 16 Mono Bit".
Estas performances so particularmente importantes pois uma converso pode influenciar os ficheiros Wav ou Mp3.



CONVERSO EM FICHEIRO WAV OU MP3:
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

 'possvel usar o DSpeech para a converso do texto em um arquivo Wav ou Mp3. Se o formato mp3 for o escolhido,  dada a possibilidade de especificar as caractersticas da compresso, na verdade, pode ser configurado para privilegiar as dimenses, em detrimento da qualidade do udio do arquivo produzido, ou para obter uma converso equilibrada entre tamanho e qualidade.



EDITAR O TEXTO:
~~~~~~~~~~~~~~~~~~~~

Para alm das funes de edio padro (encontrar, substituir, cortar etc.), este programa possui uma funo particular, que permite "Remover os retornos inteis". Serve para eliminar todos os retornos inteis que estejam presentes no texto, os quais poderiam limitar a fluidez da leitura das vozes artificiais. Na verdade, muitas vezes os textos contm retornos, quase desnecessrios, que afectariam negativamente a leitura.


CRIAO DE AUDIOLIVROS:
~~~~~~~~~~~~~~~~~~~~~~~
*/*
O programa suporta Uma srie de opes para a criao de audiolivros, de forma particular, a possibilidade de dividir O texto em vrios ficheiros com diversas duraes. Tambm  possvel usar a subdiviso manual do texto em ficheiros. 
Neste caso,  necessrio inserir a palavra-chave #BREAK toda a vez que se deseja iniciar um novo ficheiro.
Atravs do menu "Anexar"  possvel unir mais ficheiros de texto, um depois do outro.
Entre um e o outro, a palavra-chave, #BREAK,  de diviso ser inserida #automaticamente para que permita a Subdiviso dos arquivos separados por texto.
Tambm  possvel inserir uma pausa no incio do texto, de modo que seja mantida a compatibilidade com leitores de CD ou mp3 mais antigos.



RECONHECIMENTO VOCAL:
~~~~~~~~~~~~~~~~~~

O DSpeech suporta um sistema de reconhecimento vocal que, unido a um simples sistema de scripts, lhe permite criar dilogos interativos com o utilizador do tipo:
USURIO: "Computador"
PC: "Computador pronto, quem ?"
USURIO: "Dimio"
PC: "Bem-vindo ento"
Etc.

O sistema de scripts  muito semelhante ao do BASIC, por agora as seguintes palavras-chave so suportadas:

Nota do tradutor:

Dado que o sistema de reconhecimento de voz no  vlido para o idioma portugus, optou-se por no proceder  traduo das palavras-chave. Caso o utilizador deseje saber quais so, s ter que recorrer ao manual (ingls ou italiano) para que delas possa ter conhecimento.

No menu contextual (clique direito),  possvel encontrar todas estas PALAVRAS-CHAVE com exemplos relativos.

TECLAS DE ATALHO:
~~~~~~~~~~

Todas as funes da interface apresentam teclas de atalho
F1 = Abre a ajuda
F2 = Leva o foco para o texto
F2 + CTRL = Ir para o boto "ler"
F4 = Pausa-Continua.
F5 = Ler-Parar.
F6 = Ler a partir da linha anterior
F7 = Ler a partir da linha corrente
F8 = Ler a partir da prxima linha
F9 = Ler desde o incio
F11 = Passar para a voz anterior
F12 = Passar para a voz seguinte
F11+SHIFT = Passar para a primeira voz
F12+SHIFT = Passar para a ltima voz
ESC = Parar.

ALT+LEFT = Ler a linha corrente
ALT+RIGHT = Ler a prxima linha
ALT+UP = Ler a linha anterior
ALT+DOWN = Ler a prxima linha

ALT+1 = Diminuir o volume.
ALT+2 = Aumentar o volume.
ALT+3 = Diminuir a velocidade
ALT+4 = Aumentar a velocidade
ALT+5 = Diminuir a tonalidade
ALT+6 = Aumentar a tonalidade

CTRL+SHIFT+R = Iniciar/Parar a gravao
CTRL+SHIFT+P = Tocar/Parar o que foi gravado
CTRL+SHIFT+S = Guardar/inserir o que foi gravado

ATALHOS INTELIGENTES:

Space = Ler-Parar.
Home = Ler a partir da linha corrente
PgUp = Ler a partir da linha anterior
PgDn = Ler a partir da linha seguinte

COMANDOS DE VOZ:

PLAY = Ler.
SPEAK = Ler e activar os comandos de voz.
STOP = Parar.
PAUSE = Pausar.
RESUME = Continuar.
UP = Ler a partir da linha anterior
DOWN = Ler a partir da prxima linha.
START = Ler desde o incio.
DISABLE = Desactivar os comandos de voz.



LINHA DE COMANDO:
~~~~~~~~~~~~~

 possvel especificar um nome de arquivo para abrir e reproduzir automaticamente. Isso permite executar em automtico, Como um script.


SINTAXE:

DSPEECH.ExE [/ Play] [/ Speak] [/ Wav] [/ Mp3] [/ Ogg] [/ Hidden | / HiddenFix] [FileToSpeech.txt]


INSTRUES DE LINHA DE COMANDO:

- Para abrir um ficheiro:

DSpeech.exe source.txt

- Para iniciar uma reproduo de ficheiros:

DSpeech.exe / Play source.txt

- ler em voz alta uma frase curta:

DSpeech.exe / Speak Hello!

- Para converter um ficheiro de texto em mp3:

DSpeech.exe / mp3 source.txt [destination.mp3]

- Para converter um ficheiro de texto para ogg:

DSpeech.exe / ogg source.txt [destination.ogg]

- Para converter um ficheiro de texto em wav:

DSpeech.exe / wav source.txt [destination.wav]



CONFIGURAO DO SISTEMA:
~~~~~~~~~~~~~~~~~~~~

Com o Windows NT / 2000, primeiro precisa instalar o pacote MSIC-SAPI5.1, que pode baixar da pgina da Microsoft ou Tambm de um dos seguintes links:

Http://aldostools.mysite4now.com/sapi51.msi
Http://www.arlington.com.au/sapi51.msi

Com o Windows NT / 2000, se deseja usar o reconhecimento vocal, tambm precisa instalar o mecanismo para o reconhecimento; Isso pode ser feito a partir da pgina da microsoft, baixando o pacote completo, SAPI 5.1 SDKs (60MB), o qual, depois de instalado,  assumido pelo DSpeech. Tambm pode baixar o motor sozinho (30MB) A partir deste link:

Http://clans.gameclubcentral.com/shoot/SR.zip

O Windows XP / 2003 / VISTA no precisa de nada, pois estes mecanismos j se encontram includos nos idiomas que os suportam. 

O DSpeech solicita uma resoluo de ecr de pelo menos 1024x768.
O DSpeech no funciona nos sistemas Windows 9x.



AS VOZES:
~~~~~~~~~~~

O DSpeech, usa as vozes instaladas no sistema, por padro.
 no Windows XP, existe apenas o Microsoft SAM (em Ingls.
se o MS-SAPI5.1 estiver instalado no Windows NT / 2000, ficam disponveis Duas vozes (Mike e Mary) tambm em ingls.
Os utilizadores do XP podem descarregar aqui:

Http://download.microsoft.com/download/speechSDK/SDK/5.1/WXP/EN-US/Sp5TTIntXP.exe

Estas ltimas vozes so melhores que o Sam, mas muito inferiores s vozes comercializadas pelas empresas

Como vozes pagas, de melhor qualidade que as disponibilizadas de forma grtis, encontramos as seguintes:

Acapela (vozes claras e inteligveis, mas no o mximo em termos de naturalidade).
Cepstral (apresentam uma qualidade razovel, mas os seus preos so os mais equilibrados)
Loquendo (muito bom, especialmente em termos de naturalidade e expressividade, tambm apresentam preos elevados)
RealSpeak (certamente bom).
VoiceWare (Tambm no so muito ruins, mas no so italianos).
Ivona (provavelmente o melhor).



Notas:
~~~~~~

Quando um ficheiro de mp3  inserido no texto, especialmente se tiver grandes dimenses, uma pequena pausa pode ser introduzida entre a Reproduo da linha anterior e a reproduo do ficheiro de udio, isso  normal e no Constitui um erro, porm, quando se guarda o resultado no formato de arquivo wav ou mp3, a quebra Desaparece completamente.
Para a compresso em mp3, o codec utilizado  o Blades (www.mp3dev.org), que corresponde ao arquivo "Lame.exe" includo no pacote.



CODERS:
~~~~~~~
Dimitrios Coutsoumbas (Dimio)
SKYPE: katafratto
ICQ: 145633952
E-MAIL: cyberdimio@gmail.com
HOME: http://dimio.altervista.org/


BETA-TESTERS:
~~~~~~~~~~~~~

Talksina (talksina@gmail.com)

TRADUTOR PORTUGUS:
~~~~~~~~~~~~~
ngelo Miguel Abrantes
angelomiguelabrantes@sapo.pt

S. Domingos de Rana, 18:48 26-07-2017